【AI 戰場轉移:當「推論」取代「訓練」,贏家正在換人】

【AI 戰場轉移:當「推論」取代「訓練」,贏家正在換人】


各位博友,2026 年 AI 投資最重要的結構性轉變,正在悄悄發生——市場的重心,正從「訓練」走向「推論」。


這不是概念,而是已經量化的拐點。推論工作負載在 2026 年將佔所有 AI 運算約三分之二,而這個比例在 2023 年只是三分之一、2025 年是一半。換言之,AI 的錢,正從「建模型」流向「用模型」。


為什麼這對投資者至關重要?因為遊戲規則變了。


訓練時代,大家比的是算力極限——誰的 GPU 更快、頻寬更大。但推論時代,評判標準完全不同。Evercore 將當前環境形容為「推論主導的格局」,採購準則已經從追求最大吞吐量與頻寬,轉向每個 token 的成本、電力、冷卻、使用率與總體擁有成本(TCO)。


而在「成本至上」這個新戰場,通用 GPU 的優勢正被侵蝕。


這就是 Nvidia 護城河鬆動的地方。


Nvidia 的 CUDA 生態,在訓練端依然牢不可破。Nvidia 仍主導訓練、握有逾 90% 的加速器市場。但在推論端,故事不一樣了——分析師預測,Nvidia 的推論市佔率,可能從 90% 以上跌至 2028 年的 20–30%。


原因很現實:通用 = 貴。


當一家超大規模商每天要跑數以十億計、架構固定的推論請求,專用晶片(ASIC)的經濟效益就壓倒一切。最具說服力的實證來自 Midjourney——它從 Nvidia GPU 轉用 Google TPU 後,每月運算成本由約 210 萬美元降至 70 萬美元,減幅達 65%。而更廣泛的估算指出,在大規模、多年期的推論部署中,ASIC 相對通用晶片有 40–65% 的總體擁有成本優勢。


所以,贏家是誰?


當大型雲端商紛紛自研晶片(Google TPU、Microsoft Maia、Amazon Trainium、Meta MTIA),真正穩賺的,是替它們設計與代工的「軍火商」:


- 客製化晶片設計龍頭:** 客製 ASIC 出貨預計 2026 年增長 44.6%,遠超 GPU 的 16.1%;而Broadcom 與 Marvell 合計控制約 95% 的客製 AI ASIC 協同設計市場。 - 晶圓代工的咽喉: 每一顆主要客製晶片都在台積電 3nm 製程上生產,而該製程產能利用率達 100%,需求約為供給的三倍。無論誰贏,台積電都收過路費。


但這裡有一個關鍵的反直覺結論——不是「二選一」,而是「兩者皆要」。


市場最大的誤判,是以為推論便宜、會讓 GPU 需求萎縮。事實恰恰相反:儘管預訓練增速放緩、運算由訓練轉向推論,但後訓練擴展、測試時擴展(test-time scaling)以及使用量激增帶來的運算需求,意味著世界仍然需要大量數據中心。Nvidia 的 GPU 依然是訓練與彈性工作負載的王者,只是它不再獨吞整個市場。



2026-06-26

發表評論

請先 登入註冊